1. 中国科学院地理科学与资源研究所,北京 100101;2. 中国科学院大学,北京 100049
摘 要:新一代VIIRS/DNB(Visible Infrared Imaging Radiometer Suite
Day/Night Band)夜间灯光数据受到杂散光污染,导致数据产品在夏季像元值缺失严重,空间和时间上不连续。因此,为了获取时空连续的数据,更好地推广夜间灯光数据的应用,本研究针对京津冀地区,运用三次Hermit插值法插补了5–8月的夜间灯光数据,生成了一套无缺省值的夜间灯光数据集。该数据集包含年平均和月平均两个子集,时间范围为2013–2018年,空间分辨率为15弧秒,数据量为292 MB。此外,由于该数据集过滤了火光、船只灯光等短暂性光源,因此该数据集主要适用于反映社会经济的稳定性光源研究,不适用于特定主题下的短暂性光源研究。
关键词:VIIRS/DNB夜间灯光;三次Hermite插值法;缺省值;月度产品;京津冀地区;地理科学进展
DOI: 10.3974/geodp.2019.04.10
新一代VIIRS/DNB(Visible Infrared
Imaging Radiometer Suite Day/Night Band)夜间灯光数据由于杂散光的污染,夏季(5–8月)中高纬度地区像元失真严重[1]。为此,NOAA发布了“vcm”(VIIRS Cloud Mask)和“vcmsl”(VIIRS Cloud Mask With Stray Light)两种夜间灯光产品,其中“vcm”产品中剔除了所有受杂散光污染的像元,以至于该产品含大量缺省值,时空不连续;“vcmsl”产品则根据Mills
et al.[2]提出的杂散光修正方法对污染数据进行了校正,更多地保留了中高纬度地区的数据。然而,“vcmsl”杂散光校正产品依然存在缺陷,一是该产品缺少2012和2013年的数据,以至中高纬度地区在该年份存在数据空白;二是该产品的精度有待提高[2–3],如部分地区的数据出现辐射量值整体偏小的情况[4]。因此,探索插补缺省值的新方法,对获取时空上连续的VIIRS/DNB夜光数据,推进其应用具有重要的研究意义。
由于VIIRS/DNB夜光数据的缺省值大面积存在,因此相较于空间插补方法,基于像元相邻时序关系的时序插补方法更为合适。三次Hermite插值法是时间序列插补方法的常用方法之一,该方法具有插值精度高、插值曲线平滑,且不会发生过冲(Overshoot)现象等优点[5–6],因此采用该方法插补VIIRS/DNB夜间灯光数据夏季(5–8月)的空缺值。此外,京津冀地区是我国代表性的经济、人口集聚区,且处于中高纬度地区,夏季夜光数据受杂散光污染严重。因此,本研究主要插补该区域的夜光数据缺省值,生产无空缺值的月度夜光产品,在此基础上合成年度夜光产品。
《京津冀地区VIIRS/DNB月度及年度夜间灯光数据集》[7]的名称、作者、地理区域、数据年代、时间分辨率、空间分辨率、数据集组成、数据出版与共享服务平台、数据共享政策等信息见表1。
表1 《京津冀地区VIIRS/DNB月度及年度夜间灯光数据集》元数据简表
条 目 |
描
述 |
||||
数据集名称 |
京津冀地区无缺省值的月度VIIRS/DNB夜间灯光数据集 |
||||
数据集短名 |
VIIRS_DNB_Hermite_JJJ |
||||
作者信息 |
陈慕琳 Y-3945-2019, 中国科学院地理科学与资源研究所,
chenml.19b@igsnrr.ac.cn 蔡红艳 Y-8555-2019, 中国科学院地理科学与资源研究所, caihy@igsnrr.ac.cn |
||||
地理区域 |
京津冀地区 |
|
|
|
|
数据年代 |
2013–2018 |
|
时间分辨率 月、年 |
||
数据格式 |
.tif |
数据量 |
292 MB(压缩后29.4 MB) |
空间分辨率 |
15弧秒 |
数据集组成 |
数据集由2个数据子集构成:(1) 年平均产品,包括2013–2018年逐年的年平均夜间灯光栅格数据;(1)月平均产品,包括2013–2018年各年5–8月的夜间灯光栅格数据;数据单位为nWcm-2sr-1 |
||||
基金项目 |
中华人民共和国科学技术部(2017YFC0503803);中国科学院(XDA20010203,
ZDRW-ZS-2017-4) |
||||
数据计算环境 |
Matlab2011b;ArcGIS中国科学院地理科学与资源研究所ArcGIS所内计算平台 |
||||
出版与共享服务平台 |
全球变化科学研究数据出版系统 http://www.geodoi.ac.cn |
||||
地址 |
北京市朝阳区大屯路甲11号100101,中国科学院地理科学与资源研究所 |
||||
数据共享政策 |
全球变化科学研究数据出版系统的“数据”包括元数据(中英文)、实体数据(中英文)和通过《全球变化数据学报》(中英文)发表的数据论文。其共享政策如下:(1)“数据”以最便利的方式通过互联网系统免费向全社会开放,用户免费浏览、免费下载;(2)最终用户使用“数据”需要按照引用格式在参考文献或适当的位置标注数据来源;(3)增值服务用户或以任何形式散发和传播(包括通过计算机服务器)“数据”的用户需要与《全球变化数据学报》(中英文)编辑部签署书面协议,获得许可;(4)摘取“数据”中的部分记录创作新数据的作者需要遵循10%引用原则,即从本数据集中摘取的数据记录少于新数据集总记录量的10%,同时需要对摘取的数据记录标注数据来源[8] |
||||
数据和论文检索系统 |
DOI,DCI,CSCD,WDS/ISC,GEOSS,China GEOSS |
3.1 数据源
本文的数据源为2012–2019年的“vcm”月度产品。基于三次Hermite插值法插补某一年5–8月的缺失数据时,使用插补月份前后各8个月的“vcm”产品作为原始数据。例如,插补2015年5–8月的数据时,2014年9月–2015年4月,以及2015年9月–2016年4月共计16个月的“vcm”产品为其插补的原始数据。
3.2 算法原理
原始VIIRS/DNB月度产品没有去除背景噪声和火光、船只灯光等短暂性光源,因此影像中含有负值像元和极大异常值像元。为了剔除背景噪声,插补前将原始数据中的负值像元重新赋予0值[9]。另外,由于中位数不容易受到极值干扰,因此以插补时段内最大中位数值285 nWcm-2sr-1作为阈值,将原始数据中辐射值大于该值的像元重新赋值为285 nWcm-2sr-1,以此过滤火光等极大值像元。
三次Hermite插值法的核心思想是在每个相邻时序节点所构成的区间内构造一个不高于三次的多项式。设某一像元的时序节点对应的灯光辐射值为 ,逐像元使用三次Hermite法插值时,得到的插值曲线函数满足:(1)f(xi)=yi,i=1,2…,n;(2)在任意两个插值节点之间都是不高于三次的多项式;(3)曲线满足一阶可导,但二阶不一定可导,即曲线具有保形性(shape
preserving)[10],插值得到的数据量值不会超出原始数据范围。算法在MATLAB环境下编程实现。
3.3 技术路线
数据集研发的技术路线如图1所示。以2015年为例,收集京津冀地区2014年9月至2016年4月(2015年5–8月除外)的“vcm”月度夜间灯光产品,对其进行像元尺度的异常值去除和三次Hermite插值处理,从而生成5–8月无缺省值的月度夜光产品;在此基础上,结合2015年其他月份的“vcm”产品,合成年平均夜间灯光产品。
图1
数据研发技术路线图(以2015年为例)
4.1 数据集组成
数据集由两个数据子集构成:第一个子集为夜间灯光年平均产品,包括2013–2018年逐年的夜间灯光栅格数据;第二个子集为夜间灯光月平均产品,包括2013–2018年各年5–8月的夜间灯光栅格数据。数据格式为tif.,空间分辨率为15弧秒,单位为nWcm-2sr-1,数据量为234 MB,压缩后为13.2 MB。
4.2 数据结果
以2015年为例,经插值后,京津冀地区夜间灯光空间分布如图2所示:月度(图2(a))和年度(图2(b))夜间灯光产品能够明显刻画出北京、天津、石家庄以及其他中小城市的轮廓,且能够反映出城市内部灯光亮度的差异。各城市之内,灯光辐射值最大的位置通常位于机场,如北京首都国际机场、天津滨海国际机场和天津塘沽机场(图2(b)),其灯光辐射值可达200 nWcm-2sr-1及以上;灯光辐射值最小的位置多位于城市边缘,其灯光辐射值通常小于10 nWcm-2sr-1;其他城市地区灯光辐射值通常介于10–100 nWcm-2sr-1之间,其中较为发达的商业区灯光辐射值通常介于50–100 nWcm-2sr-1之间。
图2 经插补后的夜间灯光数据
4.3 数据结果验证
夜间灯光主要反映的是稳定的人为光源,如果某一区域未遭遇重大变故(如战争、灾害等),其夜光辐射总量值的时间序列应呈较为平稳的变化趋势[11,12]。因此,本研究以2015年为例,汇总京津冀地区各月的灯光辐射总量值,并在此基础上考察了整个建模时段内(2014年9月至2016年4月)三种夜光产品(“vcm”、“vcmsl”和经三次Hermite插值的夜光产品)辐射总量值的时间变化曲线。如图3所示,在非夏季月份,三种夜光产品辐射总量值相差不大,但在夏季月份(5–8月)却存在明显差异。5–8月份因杂散光的污染,“vcm”产品中大量失真像元被剔除,导致该产品在这些月份的辐射总量值迅速下降,6月时甚至下降至0,5月和7月时也仅有少量灯光辐射值(图4(c));相反,“vcmsl”和经三次Hermite插补的夜光产品由于均对受污染像元进行了校正,因此其辐射总量值时间变化曲线变幅均比“vcm”产品平稳。然而,进一步对比发现,7月“vcmsl”产品出现辐射总量值整体相对偏小的现象,空间上表现为灯光对比度减弱,城市纹理刻画不清晰(图4(b)),相比之下,经三次Hermite插补的夜光产品更能反映出城市的结构(图4(a)),辐射总量值也更为稳定。“vcm”和“vcmsl”产品夜光辐射总量值时间序列的较大波动表明,这两套产品稳定性较差,应用于社会经济研究时,容易引入较大的数据误差;相对而言,经三次Hermite插补的夜光产品变化更加平稳,更符合社会经济指标呈缓慢变化的实事,因此更适用于社会经济类主题的研究。
图3 三种夜光产品辐射总量值时间序列对比
图4 三种夜光产品的空间分布对比(以2015年7月为例)
三次Hermite插值法作为常用的插值算法之一,具有较为明显的优势。该算法不要求原始数据符合特定的统计分布,计算过程不需要人为主观干预,耗时短(平均每个像元仅需要1.313E–04秒完成),且插值结果得力于算法的保形性而较为稳定[10],因此适合于像元数量庞大、时间序列较短的VIIRS/DNB夜间灯光时序插补。此外,该算法的计算基于原始序列的平均状态展开,一定程度上保障了插补后的灯光时序趋于平稳,从而避免了如“vcmsl”校正数据于个别月份出现整体辐射量值偏小的状况,因此更符合大部分夜间灯光呈现缓慢变化的事实(图3和图4)。与此同时,该算法在插补的过程中能有效过滤掉火光等极大异常值的影响,令其更有效地应用于平稳性社会经济活动研究。
尽管如此,三次Hermite插值算法也有其局限性。首先,该算法对于原始数据的长度有较高的要求,要求待插补序列前后两个时段均具备足够长的原始序列;其次,由于三次Hermite插值法是基于原始数据进行计算的,因此计算结果容易受到原始数据内异常值的影响;其三,由于插补计算主要基于稳定性光源展开,因此插补后的结果不体现火光、船只灯光等短暂性光源,是以插补后的数据集主要适用于反映社会经济因素的稳定性光源研究,而不适用于特定主题下的短暂性光源研究。
作者分工:陈慕琳负责数据集的算法设计和论文的撰写工作;蔡红艳负责论文的统筹及论文修改工作。
[1]
Mills, S. D.,
Straka, W., Mills, S, P., et al.
Illuminati the capabilities of the suomi national polar-orbiting partnership
(NPP) visible infrared imaging radiometer suite (VIIRS) day/night band [J]. Remote Sensing, 2013, 5(12): 6717–6766.
[2]
Mills, S.,
Weiss, S., Liang, C. VIIRS day/night band (DNB) stray light characterization
and correction [C]. Earth Observing Systems XVIII. International Society for
Optics and Photonics, 2013, 8866(11): 350–354.
[3]
Bennett, M.
M., Smith, L. C. Advances in using multitemporal night-time lights satellite
imagery to detect, estimate, and monitor socioeconomic dynamics [J]. Remote sensing of environment, 2017,
192: 176–197.
[4]
陈慕琳, 蔡红艳. VIIRS/DNB夜间灯光月度产品插补方法对比: 以北京为例[J]. 地理科学进展, 2019, 38(1): 126–138.
[5]
耿爱成.
Matlab在三次样条函数教学中的应用[J]. 价值工程, 2016, 35(18): 181–182.
[6]
Fritsch, F.
N., Carlson, R. E. Monotone piecewise cubic interpolation [J]. SIAM Journal on Numerical Analysis,
1980, 17(2): 238–246.
[7]
陈慕琳, 蔡红艳. 三次Hermite插值方法校正的京津冀地区VIIRS/DNB月度及年度夜间灯光数据集[DB/OL]. 全球变化科学研究数据出版系统, 2019. DOI: 10.3974/geodb.2019.05.14.V1.
[8]
全球变化科学研究数据出版系统. 全球变化科学研究数据共享政策[OL]. DOI: 10.3974/dp.policy.2014. 05 (2017年更新).
[9]
Shi, K.,
Yu, B., Huang, Y., et al. Evaluating the ability of NPP-VIIRS nighttime light data to
estimate the gross domestic product and the electric power consumption of China
at multiple scales: a comparison with DMSP-OLS data [J]. Remote Sensing, 2014, 6(2): 1705–1724.
[10]
Manni, C.
On shape preserving C2 Hermite interpolation [J]. BIT Numerical Mathematics, 2001, 41(1): 127–148.
[11]
Li, X., Zhang,
R., Huang, C., et al. Detecting
2014 Northern Iraq Insurgency using night-time light imagery [J]. International Journal of Remote
Sensing, 2015, 36(13): 3446–3458.
[12]
Li, X., Li,
D., Xu, H., et al. Intercalibration between DMSP/OLS and VIIRS
night-time light images to evaluate city light dynamics of Syria’s major human
settlement during Syrian Civil War [J]. International Journal of Remote
Sensing, 2017, 38(21): 5934–5951.